home *** CD-ROM | disk | FTP | other *** search
/ Aminet 21 / Aminet 21 (1997)(GTI - Schatztruhe)[!][Oct 1997].iso / Aminet / comm / www / HTTX.lha / HTTX.doc.eng < prev    next >
Text File  |  1997-07-16  |  26KB  |  802 lines

  1.                                     HTTX
  2.  
  3.                            HTML to TEXT converter
  4.                          Created by Gabriele Favrin
  5.                (E-Mail: favrin@tin.it - FidoNet: 2:333/726.8)
  6.  
  7.                            Version 1.5 - May 1997
  8.  
  9.  
  10.  
  11. Index:
  12.  
  13.   1.  Utilization terms
  14.   2.  Properties of HTTX and distribution terms
  15.   3.  Introduction
  16.   4.  Hardware requirements and installation
  17.   5.  How to use
  18.       5.1 Command line parameters
  19.       5.2 External configuration
  20.   6.  Error Messages and AmigaDOS Return Codes
  21.   7.  FAQ (advices, interfacing with other programs and more)
  22.   8.  Technical informations
  23.   9.  How to contact the Author
  24.  10.  Greetings
  25.  11.  Program history
  26.  12.  Future versions
  27.  
  28.  
  29.  
  30. -----------------------------------------------------------------------------
  31.  
  32.                               *** CHILDWARE ***
  33.  
  34. This  software  is "CHILDWARE".  The author explicitly asks whoever uses this
  35. program  to make a donation toward a beneficial corporate body which works in
  36. help of the children, in any form or way.
  37.  
  38. If  you don't know any, ask your local post office and inform yourself on how
  39. to make a payment to The UNICEF.
  40.  
  41. The amount of the offer is what you want, but please do it!
  42.  
  43. -----------------------------------------------------------------------------
  44.  
  45.  
  46.  
  47. 1.  Utilization terms
  48. ---------------------
  49.  
  50. Before  launching  this  program  on your computer, please read carefully the
  51. following  paragraph,  and  continue only if you agree with the terms written
  52. below.
  53.  
  54. THE  HTTX  AUTHOR  IS IN NO WAY RESPONSIBLE FOR MORAL AND/OR MATERIAL DAMAGES
  55. THAT HIS PROGRAM MAY CAUSE TO PEOPLE OR THINGS.  THE PROGRAMMER GAVE THE BEST
  56. FOR  LIMITING  THE  PROBLEMS  THAT  HTTX  MAY  CAUSE,  BUT  HE IS NOT ABLE TO
  57. GUARANTEE  THE  EFFICIENCY IN ALL THE SITUATIONS.  USING HTTX, YOU, THE USER,
  58. ARE RESPONSIBLE FOR ALL MORAL, MATERIAL, CIVIL AND PENAL THINGS.
  59.  
  60.  
  61. WARNING:
  62.  
  63. Many of HTML documents are under Copyright, and are not freely distributable,
  64. nor   if   converted   in  plain  text  format.   The  author  decline  every
  65. responsibility for the utilization of the files generated with HTTX.
  66.  
  67.  
  68. All  of  the  programs  mentioned  in  this  document are properties of their
  69. respective owners.
  70.  
  71.  
  72.  
  73. 2.  Properties of HTTX and distribution terms
  74. ---------------------------------------------
  75.  
  76. The executable program, the source code and the ideas on its basis are
  77. EXCLUSIVE PROPERTY of Gabriele Favrin.  All rights reserved.
  78.  
  79. HTTX is freeware, NOT public domain.  It may be spread only if the executable
  80. file and the documentation will remain unchanged.  It's allowed to distribute
  81. the files in archives different than LhA, but it's not allowed the
  82. compression of the individual files using PowerPacker or similar tools.
  83.  
  84. The insertion of HTTX or its parts in cover disks of magazines is granted
  85. only with the authorization of the author.
  86.  
  87. Commercial utilization of this package is exclusively allowed to AmiTrix and
  88. Yvon Rozijn (AWeb).
  89.  
  90. Aminet, Fred Fish, Meeting Pearls and Amy Resource staffs are authorized to
  91. include HTTX in their public domain software collections.
  92.  
  93.  
  94.  
  95. 3.  Introduction
  96. ----------------
  97.  
  98. HTTX (HTml > TXt) is a program born to convert files from HTML format, used
  99. for viewing files on World Wide Web, to pure ASCII.  There are analogous
  100. products, but since none of that has completely satisfied my needs, I started
  101. to write one by myself.
  102.  
  103. I don't say this is the best or the fastest one but surely it has some
  104. functions unpublished on similar Amiga programs till now.
  105.  
  106.  
  107.  
  108. 4.  Hardware requirements and installation
  109. ------------------------------------------
  110.  
  111. Required system:
  112. Amiga, 512K, Kickstart 2.04 (37.175) or above.
  113.  
  114. Required memory:
  115. The size of the file to convert to, and about a 15K, for buffer and other.
  116.  
  117. Install:
  118. Copy HTTX in your C: directory or in your current path.
  119.  
  120.  
  121.  
  122. 5.  How to use
  123. --------------
  124.  
  125. HTTX MUST be only launched from Shell.
  126.  
  127. Command syntax:
  128.  
  129. HTTX InputFile [OutputFile] [options]
  130.  
  131. Parameters in square brackets are optional.  It's simply required to provide
  132. a valid HTML file ("InputFile").
  133.  
  134. If there is no OutputFile specified, the OutputFile will use the following
  135. notation by default:  InputFile.txt (e.g.  "test.html" will be saved as
  136. "test.html.txt").  If a path is specified for OutputFile, that file will be
  137. saved in the specified directory.
  138.  
  139. Examples:
  140.  
  141. -> HTTX data:txt/html/aboxe.html
  142.  
  143. The file "aboxe.html" will be saved in the directory "data:txt/html/" as
  144. "aboxe.html.txt"
  145.  
  146. -> HTTX data:txt/html/aboxe.html ram:aboxe.txt
  147.  
  148. The file "aboxe.html" will be converted and saved into ram disk as
  149. "aboxe.txt"
  150.  
  151. -> HTTX data:txt/html/aboxe.html data:txt/
  152.  
  153. The file "aboxe.html" will be saved in the directory "data:txt/" and
  154. converted as "aboxe.html.txt"
  155.  
  156.  
  157.  
  158. 5.1 Command line parameters
  159. ---------------------------
  160.  
  161. HTTX offers many options on how to control the generated document.
  162.  
  163.  
  164. LEN
  165.    Maximum length for every line in the converted file.
  166.  
  167.    Default: 77 - Minimum: 15 - Maximum: 255
  168.  
  169.  
  170. INDENT or IN
  171.    Number of spaces for indentation (re-enter to the right) of the <UL> and
  172.    <DL> lists.  The specified value must allow at least two levels of
  173.    indentation regarding of the line length specified with the LEN option.
  174.  
  175.    Default: 3 - Minimum: 1 - Maximum: (LEN value - 10) / 3
  176.  
  177.  
  178. ANSI or AN
  179.    ANSI conversion of HTML styles and LINKS (HREF and NAME).
  180.  
  181.    Not to use if the converted text will go on message areas, like Fidonet or
  182.    Usenet newsgroups.
  183.  
  184.    Default: OFF (styles are not converted).
  185.  
  186.  
  187. 7BIT
  188.    Conversion of HTML entities (accent letters, symbols, and so...) to
  189.    ASCII codes lower than 128.  It's fundamental for text forward on nets
  190.    like FidoNet, where the character codes allowed must range between 32
  191.    and 127.
  192.  
  193.    IMPORTANT:  the ANSI option adds Escape codes (ASCII 27), forbidden on
  194.    FidoNet, and strongly not recommended for a non personal use (broadcast)
  195.    of converted text.
  196.  
  197.    Default: OFF (8 bit chars are not converted).
  198.  
  199.  
  200. HRMODE or HR
  201.    HTML documents often have the <HR> TAG, which defines a separating line
  202.    between paragraphs.  HTTX allow the management of these lines in many
  203.    ways:
  204.  
  205.    HRMODE=0
  206.       No lines drawn.
  207.       It was NOHR in previous versions of HTTX.
  208.  
  209.    HRMODE=1
  210.       Lines are drawn using the minus "-" character.
  211.  
  212.    HRMODE=2
  213.       Lines are drawn using underlined spaces (in ANSI).  This mode
  214.       generates a more beautiful line, but introduces ANSI codes,
  215.       absolutely to avoid if the text will go on Fidonet or Usenet
  216.       newsgroups.
  217.  
  218.    Default: HRMODE=1 (lines are inserted using the minus "-" character).
  219.  
  220.  
  221. NOALIGN or NA
  222.    HTTX supports (right or center) alignments of texts and separators (<HR>).
  223.  
  224.    Examples:
  225.  
  226.                                 centered text
  227.                                                            right-aligned text
  228.  
  229.    If NOALIGN option is ON, both the above lines will start on left margin,
  230.    this saves characters.
  231.  
  232.    Default: OFF (alignment is rightly converted).
  233.  
  234.  
  235. FILENOTE or FN
  236.    Saves the document title (<TITLE>) as output file comment.  Only first 64
  237.    characters are saved, as HTML standard.
  238.  
  239.    Default: OFF (title is not saved as comment, but inside the file).
  240.  
  241.  
  242. SITE
  243.    Adds the specified URL to output file.
  244.    Useful to remember from which document the file comes from.
  245.  
  246.    Example:
  247.    HTTX ram:children.html SITE=http://www.unicef.org
  248.  
  249.    will start the file with "URL  : http://www.unicef.org"
  250.  
  251.    Note:  this option has priority on GETNOTE, so specifying a site this
  252.    will be used, also if that option is active.
  253.  
  254.    Default: OFF (without this option the URL will not be added).
  255.  
  256.  
  257. GETNOTE or GN
  258.    Uses InputFile comment as URL.  This option replaces SITE, and it is
  259.    useful with files saved using AWeb browser, and all other browsers which
  260.    save the URL in the comment.  AmigaDOS comment length limit is 80 chars.
  261.  
  262.    Default: OFF.
  263.  
  264.  
  265. NOHEADER or NOHEAD
  266.    Do not insert the title (<TITLE>) and the URL in converted file.  This
  267.    option automatically turns off the SITE/GETNOTE options, if present.
  268.  
  269.    Default: OFF (title and URL may be added).
  270.  
  271.  
  272. HREF or LINK
  273.    Adds addresses of the (<A HREF>) TAGS (links).
  274.    Very useful if the document contains links you want to keep.
  275.  
  276.    Default: OFF (links not added).
  277.  
  278.  
  279. IMG
  280.    Adds the ALT-text of images (<IMG>) to output file.
  281.    Useful if the document contains images with descriptions.
  282.  
  283.    Default: OFF (ALT-text not added).
  284.  
  285.  
  286. BADHTML or BAD
  287.    Partial support for documents created out of HTML standard.  Use this
  288.    option only if the converted page is somewhere textless.  Using this
  289.    option with correct HTML documents, may cause unpredictable results in
  290.    the converted document.
  291.  
  292.    Default: OFF (HTTX uses standard DTD rules).
  293.  
  294.  
  295. FORCE
  296.    Forces conversion of input file without checking if it is an HTML
  297.    document.
  298.  
  299.    USE IT AT YOUR OWN RISK:  conversion of text or binary files may cause
  300.    unpredictable results.
  301.  
  302.    Normally, HTTX considers valid an HTML file when:
  303.  
  304.    - it has an .html or .htm extension
  305.    - starting TAG is <HTML>
  306.    - starting TAG is <!DOCTYPE ...>
  307.  
  308.    This option should be specified if the three above conditions are false,
  309.    even if the file is an HTML document.
  310.  
  311.    Default: OFF (automatic check of file).
  312.  
  313.  
  314. STDIO
  315.    Show the converted file on the screen without saving it on disk.  This
  316.    option automatically enable the QUIET option.
  317.  
  318.    Default: OFF (converted file is saved to disk).
  319.  
  320.  
  321. PRINT
  322.    Prints the document instead of displaying or saving it.
  323.  
  324.    printer.device will convert standard ANSI codes and end-of-lines to the
  325.    ones used by specific Printer, set with the "Printer" program, located
  326.    in the "Prefs" drawer.
  327.  
  328.    This option is required if you want to print the converted document,
  329.    especially if the ANSI option is enabled, because ANSI codes used for
  330.    conversion are different from the printer ones, which are more generic.
  331.  
  332.    Previous version of HTTX used a solution like "HTTX aboxe.html prt:",
  333.    which is now to avoid.
  334.  
  335.    The option automatically enables QUIET option, and turns off FILENOTE
  336.    and STDIO options.
  337.  
  338.    Default: OFF (document is displayed on screen or saved to a file).
  339.  
  340.  
  341. APPEND
  342.    Normally HTTX overwrites existing file.
  343.  
  344.    If APPEND is ON, the converted text will be added to the end of the
  345.    specified file.
  346.  
  347.    Default: OFF (overwrite output file, if already exists).
  348.  
  349.  
  350. NOCFG
  351.    HTTX loads a default configuration from ENV:httx.prefs (if another is not
  352.    specified in the CFG option).  If this option is ON, HTTX uses the default
  353.    values for the options or the parameters specified in the command line.
  354.  
  355.    For informations on external configuration, see section 5.2.
  356.  
  357.    Default: OFF (HTTX searches for the configuration).
  358.  
  359.  
  360. CFG
  361.    With this option is possible to specify the name of the configuration file
  362.    used by HTTX.  This file MUST be present in the ENV: directory.
  363.  
  364.    This options turns NOCFG OFF.
  365.    For informations on external configuration, see section 5.2.
  366.  
  367.    Default: OFF (HTTX loads the httx.prefs configuration file).
  368.  
  369.  
  370. QUIET
  371.    Do not display any HTTX message.  This option is useful when the program
  372.    is used within a script.
  373.  
  374.    WARNING:  if active, this option also hides error messages.  Anyway, the
  375.    AmigaDOS error codes are always returned.
  376.  
  377.    Default: OFF (HTTX output is displayed).
  378.  
  379.  
  380. If not specified, HTTX uses the default settings.
  381.  
  382. When conversion is finished, if QUIET option is OFF, HTTX will show:
  383.  
  384.  - size of input and output files.
  385.  - the presence of 8 BIT chars and their conversion if active.
  386.  - TABs or ASCII chars less than 32 not converted because included in
  387.    pre-formatted text.
  388.  - non-standard HTML comments, which can make invisible parts of document.
  389.    If the converted file appears incompleted, try using BADHTML option.
  390.  
  391.  
  392.  
  393. 5.2 External configuration
  394. --------------------------
  395.  
  396. HTTX supports an external configuration, that is a text file that includes
  397. the most used options, not to be typed every time you use the program.
  398.  
  399. By default (except when NOCFG option is set, or CFG option with a different
  400. filename) HTTX searches the "httx.prefs" file in the ENV: directory.
  401.  
  402. It's possible to create multiple configurations, for example one to use for
  403. file conversion and another one to use for print, creating different
  404. configuration files and enabling the CFG option with the name of the file
  405. (it's unnecessary to specify ENV:).
  406.  
  407. Example:
  408.  
  409. -> HTTX aboxe.html
  410.  
  411. Converts "aboxe.html"; using default configuration (httx.prefs).
  412.  
  413. -> HTTX aboxe.html PRINT CFG=httxprt.prefs
  414.  
  415. Converts "aboxe.html" using the configuration file called httxprt.prefs
  416. located in the directory ENV:.
  417.  
  418.  
  419.  
  420. Allowed parameters
  421. ------------------
  422.  
  423. External configuration supports a subset of available command line options.
  424. Each option MUST be specified in its extended form (for example ANSI, not AN,
  425. INDENT instead of IN, and so on).
  426.  
  427. The file must contain just the options and their possible parameters.  It's
  428. allowed to write an option per line, for better readability.
  429.  
  430. Available options (for description see section 5.1) are the following:
  431.  
  432. LEN      - maximum length of lines.
  433. INDENT   - size of indentation.
  434. ANSI     - allow use of ANSI codes in conversion.
  435. 7BIT     - conversion of HTML entities with ASCII code >127 to 7 bit chars.
  436. HRMODE   - line tracing mode.
  437. NOALIGN  - turn off center or right alignment.
  438. FILENOTE - save HTML document title as file comment.
  439. GETNOTE  - use of original file comment as URL in destination file.
  440. NOHEADER - don't add URL and title of original HTML document.
  441. HREF     - add links (<A HREF>) to destination file.
  442. IMG      - add ALT-Text of images to destination file.
  443. BADHTML  - partial support for badly written HTML.
  444.  
  445. Parameters specified on command line override the ones specified in
  446. configuration file.  If the options exist, they will be toggled.  Examples:
  447.  
  448. If a configuration file has the following line:
  449.  
  450. IMG GETNOTE LEN=70
  451.  
  452. and on command line you write:
  453.  
  454. -> HTTX aboxe.html IMG
  455.  
  456. the result is IMG turned on because it's present in configuration line, but
  457. turned off again because it's also present in command line.
  458.  
  459. -> HTTX aboxe.html LEN=74
  460.  
  461. LEN is both present in configuration file and command line, but this one
  462. overrides the previous value.  LEN is now set to 74.
  463.  
  464.  
  465.  
  466. How to create an external configuration
  467. ---------------------------------------
  468.  
  469. External configuration files are in effect system variables, managed with
  470. SetEnv and GetEnv.
  471.  
  472. System variables are located in ENVARC: directory (on disk) and ENV:
  473. (generally on RAM).  So, the contents in ENV: are valid only for the current
  474. session, while the contents in ENVARC: are also valid after a reset.
  475.  
  476. To permanently save a configuration file, copy it both in ENV: and ENVARC:.
  477.  
  478. HTTX configuration may be fully managed using the plugin for the AWeb WWW
  479. browser.
  480.  
  481. From shell:
  482.  
  483. - creation of configuration file
  484.  
  485.   SetEnv httx.prefs "options"
  486.  
  487.   httx.prefs is the default filename.  You can use the name you want.
  488.   Options must be included between quotation marks to be compatible with some
  489.   kind of shells (like csh).
  490.  
  491.   The configuration file must be saved to ENV: (to use in current session)
  492.   and to ENVARC: (to future use, after having turned off the machine).
  493.  
  494. - configuration editing
  495.  
  496.   Use your favourite text editor (Ed, Cygnus Editor, GoldEd, and so on).
  497.   Remember to save the file to ENVARC: if you want to permanently store
  498.   changes.
  499.  
  500.  
  501.  
  502. 6.  Error Messages and AmigaDOS Return Codes
  503. --------------------------------------------
  504.  
  505. When execution terminates, HTTX puts out the appropriate AmigaDOS Return Code
  506. (RC), reusable within scripts to determine if the conversion was successfull
  507. or not.  See your AmigaDOS handbook for a complete list of error codes.
  508.  
  509. In case of error, if QUIET is off, the appropriate AmigaDOS message will be
  510. displayed.
  511.  
  512. Following there's a list of the most common errors.  If the system is
  513. localized, messages are displayed in the appropriate language.  See your
  514. AmigaDOS manual for further information.
  515.  
  516. Argument line invalid or too long
  517.    Arguments entered in a wrong way.
  518.  
  519. *** Break
  520.    The user has pressed Control-C keys, interrupting the conversion, and the
  521.    output file has been removed.
  522.  
  523. Not enough memory available
  524.    There is no available memory to allocate the buffers used by HTTX.
  525.  
  526. Object not found
  527.    Specified file doesn't exist or it's unaccessible.
  528.  
  529. Object is not of the required type
  530.    The input file seems non to be an HTML document.
  531.    Try using the FORCE option.
  532.  
  533.  
  534. HTTX can show other errors, due to wrong use of commands or options:
  535.  
  536.  
  537. The line length must be within 15 and 255 characters (current is NN)
  538.    The line size specified with LEN parameter is a number less than 15 or
  539.    more than 255.
  540.  
  541. Indentation size must be at least 1 (current is NN)
  542.    The indentation size must be at least one character wide.
  543.  
  544. With line length XX, indentation size YY, max indent level is ZZ.
  545. You must allow at least 3 indentations.
  546.    The maximum indentation level, with this line size and indent value, is
  547.    less than 3.
  548.  
  549. HRMODE value must be 0, 1 or 2
  550.    Value set for HRMODE is not valid.  It must be 0, 1 or 2.
  551.  
  552.  
  553. Finally, there are a few warnings which may be displayed.  The conversion
  554. will be executed, but there can be situations altering the final result:
  555.  
  556.  
  557. Error in env config. HTTX will use its defaults
  558.    External configuration has errors.  HTTX will use the default settings and
  559.    the parameters passed to the command line.
  560.  
  561. ENV config 'NAME' not found.
  562.    The configuration specified with CFG option was not found.
  563.    HTTX will use the default settings and the parameters passed to command
  564.    line.
  565.  
  566. Found non-ASCII chars in preformatted text!
  567.    In a non formatted text section HTTX found some 8 BIT characters.
  568.    Do not ignore this warning if the converted text have to be posted in
  569.    Fidonet conferences or Usenet newsgroups.
  570.  
  571. This file contains non standard HTML comment(s)!
  572.    File could be not completely converted, since non standard HTML comments
  573.    were found.  If this is the case, try using BADHTML option.
  574.  
  575.  
  576.  
  577. 7.  FAQ (advises, interfacing to other programs and more)
  578. ---------------------------------------------------------
  579.  
  580. Q. "ANSI styles (bold, italic, underline, blue) stop after first line."
  581. A. ANSI standard says the end of line don't cause a style to stop.  So, the
  582.    problem is in the text viewer programs, not in HTTX.  Standard shell and
  583.    Multiview, for example, work correctly.
  584.  
  585. Q. "Converted text from HTTX appears centered, but in the original document
  586.    it isn't."
  587. A. This can happen with bad written pages, with alignment TAGS followed by
  588.    tables (which are left aligned by default).  To solve the problem use the
  589.    NOALIGN option.
  590.  
  591. Q. "Sometimes alignment doesn't work, wordwrap and lists are not correctly
  592.    formatted".
  593. A. It's the text included between <PRE> or <LISTING> TAGS.  HTTX copies the
  594.    text as is, without formatting.  This choice was made because often that
  595.    kind of text contains sources that the author wishes to keep as is.
  596.  
  597. Q. "Some pages are not correctly converted..."
  598. A. There may be many reasons:  layout based on tables (actually not fully
  599.    supported.  See section 8), errors on HTML source (HTTX is quite tolerant,
  600.    but there are limits) or errors on HTTX engine.  If you think the page is
  601.    correct, send me an E-mail with its URL.
  602.    (E-Mail: favrin@tin.it, FidoNet: 2:333/726.8)
  603.  
  604. Q. "How can I directly use HTTX from AWeb or Directory Opus?"
  605. A. About AWeb, users of version 3.0 or better can use the enclosed Arexx
  606.    plugin.
  607.  
  608.    HTTX can be used from Directory Opus by creating a button configured as
  609.    follow (Directory Opus 4.12):
  610.  
  611.    New Entry/AmigaDOS:
  612.      C:HTTX {f} {d}
  613.      (replace C: with path where HTTX is)
  614.  
  615.    With this configuration, file selected from "source" directory will be
  616.    converted to text and saved to the "destination" directory.
  617.  
  618.    By activating "Do all files" flag it's possible to convert more than one
  619.    file, by selecting them and clicking the HTTX button.
  620.  
  621. Q. "How can I improve the performance of HTTX?"
  622. A. To speed up the conversion, try using a filesystem with block of 1024
  623.    bytes, like RAM disk.  If memory is almost full or fragmented, saving to
  624.    RAM disk will slow down the conversion process.
  625.  
  626.  
  627.  
  628. 8.  Technical informations
  629. --------------------------
  630.  
  631. This section talks about some thematics of HTML and its implementation in
  632. HTTX.  The reading of this paragraph is not required to learn the use of
  633. HTTX.
  634.  
  635. What is supported:
  636.  
  637.  - Entities described in RFC 1866, © and ® (NHTML).
  638.  - Separators (<DIV>, <BR>, <P>, <HR>) and width font change (<H1>...<H6>).
  639.  - Alignment (center and right) of text (headers and paragraphs) and
  640.    separators.
  641.  - Physical and logical styles.
  642.  - Numbered (<OL> with possible START attribute), not numbered (<UL>) and
  643.    definition (<DL>) lists until a maximum of 255 levels.
  644.  - Document title (<TITLE>).
  645.  - Links (<HREF>), user maps and inline images (<IMG> with optional
  646.    ALT-text).
  647.  - Pre-formatted text (<PRE> and <LISTING>).
  648.  - Non standard use of "<" and ">" in a preformatted text (it may be
  649.    changed).
  650.  
  651. What is not supported:
  652.  
  653.  - Tables (<TABLE>).  Anyway, the readability of text in tables has been
  654.    improved in this version.
  655.  
  656. These TAGS will be probably implemented in future releases of HTTX.
  657.  
  658.  - Conversion of entities in sequences that can be handled by Spot, Mail
  659.    Manager, and similar.  I have tried, but the number of chars required even
  660.    for one BOLD line is too high (every word should be preceded and followed
  661.    by an "*").
  662.  - <SCRIPT>, <APPLET>, <STYLE>:  I can't see how could I support them,
  663.    so I skip them at all.
  664.  
  665. Implementation of the standard:
  666.  
  667.  - Unknown TAGS are ignored.
  668.  - Double spaces, trailing and leading blanks for each line are removed.
  669.  - Non ASCII chars (<32) are converted to spaces.
  670.  - EOL PC (CR+LF) and MAC (CR) are converted to Amiga format (LF).
  671.  - For better readability of text in tables, <TD> is converted in a space and
  672.    <TR> TAGS are converted to EOL.  Between two <TR> (a table row) is
  673.    inserted maximum one separator (<HR>).
  674.  - Consecutive EOLs are reduced to one EOL (except for <BR>).
  675.  
  676.  
  677.  
  678. 9.  How to contact the Author
  679. -----------------------------
  680.  
  681. Beyond every communication, problem, bug report, advise or other things, a
  682. comment about HTTX will be appreciated, and segnalation of actions toward
  683. corporations who takes care of children (see CHILDWARE).
  684.  
  685. E-Mail : favrin@tin.it
  686. FidoNet: 2:333/726.8
  687.  
  688. Please write me in italian or english, thank you.
  689.  
  690. HTTX support page:
  691. http://freepage.logicom.it/poing/httx/index.html
  692.  
  693. (AKA http://www.logicom.it/personal/poing/httx/index.html )
  694.  
  695.  
  696.  
  697. 10.  Greetings
  698. --------------
  699.  
  700. Betatesting of version 1.5:
  701.  
  702. Claudio Mazzuco       kirk@maya.dei.unipd.it
  703. William Parker        wparker@bill.amitrix.com
  704. Giuseppe Pasanisi     peppe@mail5.clio.it
  705. Giuseppe Ammendolia   ryuga@freenet.hut.fi
  706.  
  707. This english documentation (translated from the italian one):
  708.  
  709. Fabio Belli           zak@anturio.com
  710.  
  711. Betatesting of AWeb Plugin:
  712.  
  713. William Parker        wparker@bill.amitrix.com
  714. Dale Currie           dalec@zorro.amitrix.com
  715.  
  716. Very much thanks to Yvon Rozijn for having wanted HTTX inside AWeb II and for
  717. this great year!
  718.  
  719. Thanks to W. v. Oortmerssen for the splendid AmigaE, used to realize HTTX.
  720.  
  721. Finally special greetings to whom wrote me about HTTX and to whom use it!
  722.  
  723.  
  724.  
  725. 11.  Program history
  726. --------------------
  727.  
  728. V1.0 (July 1996)
  729.    First public release.
  730.  
  731. V1.1 (November 1996)
  732.   +Improved speed.
  733.   +Added STDIO, QUIET, BADHTML, NOHEADER, GETNOTE options.
  734.   +Added AmigaDOS return codes support.
  735.   +Added <ADDRESS> and <LISTING> TAG support.
  736.   +Modified <BR> and <LI> management, as requested by HTML 3.2 standard.
  737.   +Rewritten entities management:  now they will be converted even if they
  738.    are not closed with ";".
  739.   +Extended 7 bit conversion, now faster, more complete (almost all
  740.    characters are converted) and more accurate (no accent letters are left in
  741.    words, for example "HTTX è bello" becomes "HTTX e` bello" while
  742.    "Belphégor" will become "Belphegor".
  743.   +As popular demand, default 7BIT option is now OFF.
  744.   +Improved support for multiline comments and badly written HTML.
  745.   +Added support for TAGS with LF or "<" and ">".
  746.   -Fixed many little aesthetical bugs in conversion (double spaces in some
  747.    cases, bad chars exiting from <PRE> and <SCRIPT> and other).
  748.   -Fixed an error that could cause a lock on file to convert.
  749.   -Fixed an error in FILENOTE option.
  750.  
  751. V1.1a (January 1997)
  752.   -Removed a stupid and rare bug in TAGS management.
  753.   -Fixed support for MAC EOLs.
  754.  
  755. V1.1b
  756.   -Fixed management of some entities.
  757.  
  758. V1.5 (May 1997)
  759.   +Speeded up very much the program, due to a complete rewrite of HTML parser
  760.    and optimization of many functions.
  761.   +Added options HRMODE, NOALIGN, PRINT, APPEND, NOCFG, CFG.
  762.   +Added alignment support (center and right) of text and separators.
  763.   +Added support for various TAGS and HTML attributes (like START in numbered
  764.    lists).
  765.   +Optimized the ANSI output.
  766.   +Added support for ANSI separators.
  767.   +Added support for external configuration.
  768.   +Improved entities support, now identified, despite of closing character.
  769.   +More clear HTTX internal error codes.  DOS errors substituted with
  770.    PrintFault() of AmigaDOS.
  771.   +Added support for "HTTX source_filename destination_path".
  772.   +Improved support of separators in tables.
  773.   +Now HTTX follows with higher fidelity HTML DTD for many TAGS.
  774.   -Fixed some bugs in wordwrap.
  775.   -Fixed all signaled bugs in version 1.1b.
  776.   +... Many many other improvements!!!
  777.  
  778.  
  779.  
  780. 12.  Future versions
  781. --------------------
  782.  
  783. HTTX is a program in continuous growth, because I daily use it, so I notice
  784. lacks or possible improvements.
  785.  
  786.  
  787.  
  788. -----------------------------------------------------------------------------
  789.  
  790.                               *** CHILDWARE ***
  791.  
  792. This  software  is "CHILDWARE".  The author explicitly asks whoever uses this
  793. program  to make a donation toward a beneficial corporate body which works in
  794. help of the children, in any form or way.
  795.  
  796. If  you don't know any, ask your local post office and inform yourself on how
  797. to make a payment to The UNICEF.
  798.  
  799. The amount of the offer is what you want, but please do it!
  800.  
  801. -----------------------------------------------------------------------------
  802.